#символическое рассуждение06.07.2025
AbstRaL: Повышение устойчивости LLM через абстрактное мышление и обучение с подкреплением
AbstRaL использует обучение с подкреплением для обучения LLM абстрактному мышлению, что значительно повышает их устойчивость и точность на изменённых задачах GSM8K по сравнению с традиционными методами.